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摘要 : [目的 /意义 ] 随 着 科技 文献 资源 的 急剧 增长 ,用 户 海 没 在 科技 文献 的 海洋 中 ,为 用 户 提 供 快速 、 精 准 
的 细 粒 度 知 识 元 服务 将 成 为 未 来 文献 知识 检索 的 发 展 趋 热 。[ 方 法“ 过程 ] 在 分 析 科技 文献 文本 结构 的 基础 上 ， 
逐步 深入 到 科技 文献 的 内 容 中 ,以 期 通过 构建 一 种 面向 科技 文献 知识 表示 的 知识 元 本 体 模型 ,将 科技 文献 内 容 
中 名义 完整 的 细 粒 度 知识 点 表示 成 具有 统一 结构 的 知识 元 。[ 结果 /结论 ] 以 一 篇 科技 文献 为 实例 ,展示 笔者 提 
出 的 基于 知识 元 本 体 模 型 的 科技 文献 知识 表示 方法 ,但 该 示例 仅 呈 现 了 科技 文献 中 引言 部 分 的 相关 知识 点 , 需 


进一步 验证 该 知识 元 本 体 模型 的 有 效 性 。 
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科技 文献 是 科技 工作 者 及 科研 人 员 进 行 科学 探索 
的 玩 品 ,蕴含 着 丰富 的 专业 化 科技 成 果 和 重要 的 科研 
知 渴 发现 , 极 具 参 考 价值 和 应 用 价值 。 科 技 文献 知识 
瓷 漏 的 共享 与 交流 不 仅 有 利于 挖掘 科技 文献 的 潜在 价 
俐 -更 能 促进 知识 的 学 习 、 创 新 与 发 现 ,推动 科学 的 发 
寿司 进步 。 在 大 数据 时 代 下 ,科技 文献 不 仅 总 量 巨大 ， 
而 建 各 领域 科技 文献 的 学 术 期 刊 以 平均 每 年 4.7% 的 
皮 率 叶 爆 炸 式 增长 ,科技 工作 者 淹没 在 海量 科技 文献 
的 狂 洋 中 站。 

三 现今 人 们 汲取 所 需 的 科技 文献 知识 资源 时 ,通常 
依 丽 传统 的 信息 检索 技术 ,获取 以 篇 章 为 单位 的 科技 
文献 , 逐 篇 浏览 文献 中 蕴含 的 知识 点 ,人 工 筛选 出 所 需 
的 相关 知识 点 ,这 极 大 地 耗费 了 科研 人 员 的 时 间 及 精 
力 , 降 低 了 科技 文献 知识 资源 获取 的 效率 。 产 生 这 样 
低 效 的 文献 知识 获取 方式 的 根源 在 于 ,当前 的 检索 
工具 通常 以 粗 粒 度 的 文献 为 基本 单元 进行 文献 的 措 
述 .表示 及 组 织 ,而 未 将 文献 的 知识 控制 单元 细 化 到 
知识 点 ,导致 信息 检索 系统 难以 快速 .精准 地 匹配 到 
用 户 真 正 所 需 的 知识 点 ,造成 了 资源 海量 .知识 饥 渴 
的 窗 状 。 

为 了 解决 上 述 问题 ,目前 ,学 者 们 主要 从 知识 点 的 

地 征 和 科技 文献 的 知识 结构 两 个 角度 进行 深入 研究 。 


@@ 从 某 类 知识 点 的 特征 着 手 ,构建 该 类 知识 点 的 抽取 
规则 ,并 依照 规则 匹配 算法 ,从 科技 文献 文本 内 容 中 抽 
取出 定义 中 方法 中 或 创新 点 等 单一 类 型 的 知识 
点 ,而 且 这 些 知 识 点 一 般 分 散在 文献 的 各 章节 区 域 
中 , 较 难 全 面 地 定位 到 所 有 相关 的 知识 点 ,使 得 知识 
点 抽取 的 效率 及 精准 度 降低 ;名 为 了 更 充分 地 挖掘 
科技 文献 中 的 知识 资源 ,尝试 通过 对 科技 文献 中 某 
一 区 域 或 模块 的 知识 结构 进行 分 析 , 给 出 一 个 资源 
描述 框架 5 ,用 于 挖掘 文献 正文 区 域 中 所 包含 的 承 
载 着 完整 科学 研究 思路 的 知识 点 集合 ,如 研究 的 领 
域 .背景 .问题 .理论 方法 .评价 等 知识 点 ,但 该 方法 
缺乏 对 科技 文献 外 部 特征 的 描述 ,无 法 详尽 地 描述 
出 科技 文献 内 容 中 所 包含 的 各 类 知识 点 和 知识 结 
构 , 未 能 统一 表示 出 这 些 知识 点 内 部 的 属性 结构 ,不 
利于 知识 的 推理 与 发 现 。 

因此 ,笔者 尝试 从 文献 知识 组 织 的 基础 环节 一 一 
知识 描述 与 表示 环节 ,通过 系统 分 析 科 技 文献 文本 结 
构 , 以 知识 元 本 体 理论 为 基础 ,研究 科技 文献 的 细 粒 度 
知识 表示 方法 ,以 期 从 细 粒 度 视角 给 出 一 种 全 面 .规范 
的 科技 文献 知识 表示 法 , 旨 在 为 统一 描述 科技 文献 知 
识 结构 及 其 内 所 含 的 学 术 知 识 点 ,实现 细 粒 度 的 精准 
知识 点 服务 提供 理论 支持 。 
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1 文献 知识 表示 研究 现状 


文献 知识 表示 是 文献 知识 组 织 .检索 和 应 用 的 基 
础 ,其 完备 性 及 适用 性 影响 着 文献 知识 服务 的 水 平 。 
目前 ,根据 研究 者 们 是 否 对 知识 对 象 的 内 部 结构 关联 
进行 描述 ,将 文献 知识 表示 方法 分 为 两 类 , 即 基于 特征 
的 知识 表示 方法 中 和 结构 化 的 知识 表示 方法 "1!。 

基于 特征 的 知识 表示 方法 将 知识 对 象 视 为 相互 独 
立 的 个 体 ,通常 以 * 属 性 - 值 " 对 .n 元 组 ,特征 向 量 等 
形式 ,清晰 地 描述 出 知识 对 象 的 属性 特征 ,便于 对 知识 
对 象 进行 识别 及 标 引 。 该 类 方法 中 具有 代表 性 的 方法 
有 :DD 纳 米 出 版 物 模式 ,以 简易 的 RDF 三 元 组 生成 命 
名 图 的 形式 ,描述 科学 文献 的 结论 出 处 .结论 的 背景 及 
语 境 信息 等 " ,将 文献 中 的 科学 结论 表示 成 具有 统一 
结 移 的 最 小 出 版 信息 单元 , 却 忽略 了 这 些 信息 单元 之 
间 窒 在 的 潜在 科学 规律 ;@ 知 识 元 表示 方法 ,以 n 元 组 
的 形式 ,描述 期 刊 文献 知识 点 的 编号 .来 源 , 分 类 .内容 
等 针 征 ,将 文献 中 细 粒 度 的 知识 点 表示 成 内 容 相对 
完 交 目 结 构 一 致 的 知识 元 ,这 些 知识 元 则 是 在 一 定 的 
语 场 下 语义 相对 完整 的 知识 单元 ,其 形式 上 具有 多 样 
性 : 肉 容 上 具有 相对 独立 性 和 完整 性 。 当 知识 元 的 
网 容 增 加 到 一 定 程度 时 ,知识 元 可 分 解 成 更 小 粒度 的 
短 调 元 , 故 “ 知 识 元 应 具备 内 容 小 粒度 ` 可 链接 成 知识 
网 路 .可 进化 发 展 可 重 构 支持 语义 检索 等 功能 "5 。 
编 页 , 当 描 述 科技 文献 中 一 个 具体 的 论证 性 过 程 时 ,该 
知 岛 元 表示 法 仅 能 细 粒 度 化 地 描述 出 一 个 个 论点 , 论 
据 3 论 证 方法 及 结论 等 相对 独立 的 知识 元 , 却 未 能 清晰 
士民 示 出 该 文献 依托 这 些 知识 元 集合 所 构筑 的 一 个 语 
义 完整 的 论证 关系 链 。 

为 了 详细 描述 文献 内 知识 对 象 之 间 复 杂 的 语义 关 
系 ,学 者 们 给 出 了 结构 化 的 知识 表示 方法 ,如 基于 图 结 
构 的 表示 法 加 ,面向 对 象 表示 法 .产生 式 框架 表示 
法 ”本体 表示 法 “ 等 。D 基 于 图 结构 的 表示 法 ,将 
文献 中 的 知识 点 表示 成 一 个 不 可 再 分 割 的 知识 或 概念 
节点 ,由 节点 和 节点 之 间 的 语义 边 共 同 搭建 成 一 个 图 
式 结构 ,展现 文献 内 知识 点 之 间 的 语义 关联 ,代表 性 的 
方法 有 知识 网 络 "1 语义 网 络 !"5 ,概念 图 "9 等 知识 表 
示 法 。 该 类 方法 在 对 文献 知识 点 之 间 语义 关系 的 表示 
方面 具有 较 强 的 知识 表现 力 ,但 无 法 全 面 描述 出 文献 
知识 或 概念 节点 的 内 部 特征 , 且 随 着 知识 或 概念 节点 
数 呈 指数 倍增 长 ,文献 知识 点 的 检索 难度 及 成 本 也 随 
之 大 大 增加 。@) 面 向 对 象 表示 法 ,将 知识 对 象 的 属性 、 
方法 等 封装 到 结构 化 的 模块 中 ,实现 了 对 象 间 的 继承 


与 演化 ,用 于 描述 文献 内 容 中 基本 概念 等 ,但 缺少 对 知 
识 对 象 间 继承 之 外 的 其 他 语义 关系 进行 动态 表示 及 推 
理 。@ 产 生 式 框架 表示 法 ,以 填充 槽 的 框架 形式 ,描述 
文献 内 知识 对 象 的 静态 知识 结构 ,以 产生 式 规 则 表示 
知识 对 象 之 间 的 推理 规则 ,但 不 适合 复杂 的 推理 关系 。 
例如 ,采用 产生 式 框架 表示 法 来 描述 《说 文 解 字 》 中 天 
态 知 识 结构 及 其 间 的 音义 关系 ,当知 识 对 象 之 间 的 推 
理 关 系 复杂 时 ,会 导致 其 推导 效率 降低 。@ 本 体 表示 
法 ,拥有 强大 的 逻辑 推理 能 力 , 以 概念 属性、 关系 、 实 
例 等 形式 ,描述 各 主题 领域 内 文献 资源 中 知识 对 象 之 
间 的 语义 逻辑 关系 ,完成 知识 对 象 之 间 的 动态 推理 ,如 
“江海 文化 "知识 本 体 ” .专利 本 体 等。 然而 文献 
的 主题 分 类 较 多 ,表示 不 同 主题 的 本 体 缺 乏 统一 的 结 
构 ,不 利于 知识 的 表示 ,共享 及 交换 。 

上 述 方法 中 ,基于 特征 的 知识 表示 法 中 知识 元 表 
示 方法 能 详细 描述 科技 文献 内 知识 点 的 属性 特征 , 却 
未 能 全 面 表 示 出 知识 点 之 间 系 统 性 的 语义 关系 ;而 用 
于 梳理 知识 点 间 复 杂 语 义 关系 的 结构 化 知识 表示 方法 
中 ,本 体 表示 法 能 标准 化 地 描述 出 不 同 主题 领域 内 科 
技 文献 知识 点 之 间 的 系统 性 语义 逻辑 关系 , 却 难 以 突 
破 领域 性 限制 ,统一 表示 科技 文献 内 知识 点 的 结构 。 

知识 元 本 体 构建 定义 了 知识 元 的 组 织 骨 架 模 型 ， 
建立 了 知识 元 与 本 体 元 素 之 间 的 联系 ,以 概念 、 属 性 、 
方法 .关系 四 元 组 形式 ,全 面 地 描述 了 知识 对 象 中 语义 
内 容 的 内 在 结构 和 语义 关联 ,揭示 了 知识 元 的 属性 特 
征 和 知识 元 之 间 的 语义 逻辑 关系 ,是 对 领域 知识 的 规 
范 化 抽象 及 描述 ,便于 对 知识 进行 语义 推理 ,实现 知识 
的 组 织 与 检索 。 知 识 元 本 体 已 广泛 应 用 于 wiki 
知识 元 标注 学科 知识 的 语义 标 引 " 、“ 粤 海关 ” 文 
献 知识 元 的 归 类 及 其 间 的 组 合 链接 '” .饮食 与 疾病 领 
域 知识 元 之 间 的 逻辑 推理 、 基 于 文献 主题 成 因 的 知 
识 发 现 ” 等 场景 中 。 因 此 ,笔者 以 知识 元 本 体 理 论 为 
基础 ,吸纳 知识 元 及 本 体 表 示 法 的 思想 ,给 出 一 种 面向 
科技 文献 知识 表示 的 知识 元 本 体 模 型 ,以 期 解决 由 科 
技 文献 粗 粒 度 的 知识 表示 方法 导致 的 知识 获取 低 效 性 


问题 。 


2 科技 文献 文本 结构 分 析 


一 篇 科技 文献 通常 具有 物理 结构 和 人 逻辑 结构 , 物 
理 结构 呈 现 出 文献 的 主观 认 知 结构 , 即 标 题 \, 作 者 、 机 
构 章节 \ 段 . 句 \ 词 .引文 ;在 此 基础 上 ,对 文本 进行 层 
次 划分 ,挖掘 文本 中 不 同 层次 下 内 容 的 主题 ,得 到 文本 
的 逻辑 结构 , 即 篇 革 主 题 .层次 主题 .段落 主题 .句子 主 
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题 . 主 题词 .标识 词 及 分 类 号 ,以 期 表示 出 文本 内 容 中 
的 知识 结构 2 。 仅 以 单一 的 主题 分 类 法 描述 文献 内 
容 的 知识 结构 ,忽略 了 文献 中 简单 .直观 、 少 有 歧义 的 
非 主 题 文献 特征 ,导致 无 法 在 文献 检索 过 程 中 准确 排 
除 大 量 不 相关 的 文献 0 。 故 整合 上 述 文献 特征 ,将 科 
技 文献 的 特征 统一 划分 为 外 部 特征 和 内 容 特征 ,外 部 
特征 一 般 包括 符号 标识 . 书 名 、 作 者 、 机 构 名 文献 分 类 
等 ,内 容 特征 包括 主题 词 .分 类 号 等 ,便于 清晰 、 有 
效 . 全 面 地 描述 出 科技 文献 中 细 粒 度 知识 点 的 特征 。 

在 实际 应 用 中 ,科研 文献 本 身 具有 由 标题 .作者 、 
摘要 .关键 词 .正文 构成 的 特定 文本 结构 "9 ; 逐 层 深入 
到 正文 内 容 中 ,呈现 出 一 种 通用 结构 , 即 引言 .方法 . 结 
果 讨论 2 。 这 种 通用 结构 在 科技 文献 内 容 的 表达 上 
其 存 一 定 的 章节 性 语义 划分 功能 。Y，Ding 等 采用 文 
献 千 析 法 ,对 该 通用 结构 进行 细 化 ,形成 由 摘要 引言 、 
相关 研究 方法 .实验 /结果 .结论 构成 粗 粒度 的 功能 结 
梅林 。 王 鹏 等 依照 分 层 分 割 的 文本 处 理 方法 加 , 逐 层 


缺 内 


和 


涛 而 象 及 结果 ,尤其 是 对 研究 结论 方法 和 结果 的 概 
述 研 为 频繁 ""。 在 科技 文献 正文 中 ,引言 包含 背景 知 
说 阅 题 分 析 主要 工作 三 类 信息 叫 ,而 在 问题 分 析 之 
前 入 要 引入 研究 问题 ,描述 研究 的 由 来 .研究 动机 \ 研 
乱 卫 的 等 内 容 ;方法 分 为 科学 研究 方法 和 问题 解决 
方 濡 ,其 中 科学 研究 方法 包括 问卷 调查 ,专家 访谈 、 案 
例 区 析 法 等 ” ,问题 解决 方法 按 表现 形式 分 为 异型. 算 
法 而 指标 ,其 中 模型 包括 框架 类 模型 和 数学 模型 ; 
实验 主要 论述 实验 数据 ,实验 过 程 .实验 结果 评测. 实 
验 发 现 及 讨论 ,其 中 ,实验 过 程 包括 系统 的 设计 .实现 
等 ” ,另外 ,经 文献 调研 表明 ,在 评价 的 实践 中 主要 对 
评价 指标 .评价 方法 .评价 程序 等 问题 进行 研究 ” ; 结 
论 主要 包括 突出 贡献 的 阐述 、( 非 ) 预期 结果 的 说 明 、 
结果 的 推广 .未 来 的 研究 方向 竺 内容。 

上 述 科技 文献 中 的 层次 性 功能 结构 ,将 科技 文献 
中 的 知识 资源 分 割 为 细 粒 度 的 功能 性 知识 点 ,这 种 层 
次 性 功能 结构 满足 人 们 对 科技 文献 知识 点 的 使 用 需 
求 ,便于 快速 了 解 研究 背景 . 紧 跟 学 术 前 沿 等 。 由 科技 
文献 的 文本 结构 ,构建 出 科技 文献 的 分 层 信息 模型 ,能 
够 对 科研 热点 的 发 现 . 科 研 内 容 的 相似 性 和 分 类 比较 
提供 更 加 准确 的 基础 信息 。 因 此 ,笔者 将 深入 到 科技 
文献 的 文本 内 容 中 ,挖掘 科技 文献 内 容 中 的 层次 性 功 
能 结构 , 旨 在 构建 一 个 用 于 表示 科技 文献 知识 的 知识 
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元 本 体 模型 ,统一 ,全 面 地 描述 科技 文献 中 细 粒 度 的 功 
能 性 知识 点 特征 及 其 文本 结构 中 知识 点 之 间 的 逻辑 关 
系 ,为 实现 科技 文献 知识 点 的 精准 性 检索 服务 提供 理 
论 基础 。 

3 ”科技 文献 的 知识 元 本 体 模型 

知识 元 本 体 结构 通常 被 表示 成 四 元 组 形式 , 即 
K=(C,P,M,R) ,通过 概念 的 属性 集 P 及 方法 集 M 描 
述 文献 知识 元 的 概念 C 特性 ,通过 概念 之 间 的 语义 关 
系 集 R 描述 知识 元 的 内 部 体系 结构 及 知识 元 之 间 的 网 
络 化 结构 ,为 知识 元 语义 链接 的 构建 提供 保障 。 已 有 
的 知识 元 本 体 结构 中 的 方法 集 与 关系 集 仅 分 别 表示 出 
概念 之 间 的 函数 关系 及 语义 关系 ,未 能 充分 描述 概念 
的 属性 之 间 的 函数 关系 以 及 概念 .属性 方法 三 者 之 间 
的 语义 关系 。 

在 对 科技 文献 文本 结构 的 系统 性 分 析 的 基础 上 ， 
笔者 对 上 述 知 识 元 本 体 结构 进行 延伸 及 拓展 ,实现 科 
技 文献 知识 元 本 体 模型 的 设计 。 借 助 本 体 中 概念 集 的 
层次 化 结构 ,清晰 地 描述 出 科技 文献 中 多 层次 的 文本 
结构 ;而 每 一 概念 能 抽象 地 描述 出 科技 文献 中 每 一 类 
知识 元 ,通过 对 概念 的 属性 特征 进行 细致 地 刻画 ,形式 
化 地 表示 科技 文献 内 各 类 知识 元 的 内 部 结构 ;定义 本 
体 模 型 的 方法 集 ,描述 概念 之 间 、 概 念 与 属性 之 间 、 属 
性 与 属性 集 之 间 所 存在 的 函数 关系 ,明确 科技 文献 中 
知识 元 所 属 的 概念 、 属 性 之 间 的 语义 规则 ,规范 化 表示 
出 科技 文献 中 知识 元 之 间 内 在 的 语义 关联 ;定义 概念 、 
属性 ,方法 之 间 的 关系 集 , 系 统 描 述 科技 文献 中 知识 元 
之 间 的 逻辑 关系 ,精准 呈现 科技 文献 中 隐 含 的 科学 研 
究 思路 。 

因此 ,笔者 将 在 已 有 的 知识 元 本 体 理 论 的 基础 上 ， 
依照 上 述 科 技 文 献 知识 元 本 体 的 设计 思路 ,通过 分 析 
科技 文献 的 外 部 及 内 容 特 征 , 定 义 一 个 科技 文献 知识 
元 本 体 模 型 及 其 内 部 的 概念 、 属 性 方法 及 关系 四 大 构 
成 要 素 , 旨 在 为 统一 描述 科技 文献 内 部 细 粒 度 知识 点 
特征 及 知识 关联 ,提供 一 种 面向 科技 文献 的 知识 表示 
方法 。 

3.1 科技 文献 知识 元 本 体 模型 的 数学 描述 

一 篇 科技 文献 是 由 多 个 内 容 上 相对 独立 且 语 义 上 
相互 关联 的 知识 元 构成 的 一 个 语义 相对 完整 的 小 型 知 
识 库 。 为 了 便于 用 户 精准 、 细 粒度 地 检索 到 所 需 知 识 
元 ,笔者 从 微观 层面 构建 一 种 科技 文献 知识 元 本 体 模 
型 ,统一 描述 并 表示 科技 文献 知识 元 的 组 成 及 知识 元 
之 间 的 语义 关系 。 该 知识 元 本 体 模型 可 形式 化 表示 如 
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下 : 
KEOs = {C,P6e, Mo p,Repn! 
其 中 ,KEOs 表示 科技 文献 知识 元 本 体 ,C 表示 科 
技 文献 知识 资源 中 概念 集 ,P。 表示 概念 C 的 属性 集 ， 
M。 ,表示 概念 C 及 其 属性 P 相关 的 方法 集 ,Rew 表示 
概念 C\ 属 性 己方 法 内 之 间 的 语义 关系 集 。 
对 于 任意 的 科技 文献 知识 元 。, 其 本 体 结构 中 概念 
集 C. ,属性 集 P, 方法 集 M,、 关 系 集 R, 的 结构 及 其 之 
间 的 关系 ,用 数学 公式 表示 如 下 。 
(1) 概 念 C, 的 属性 集 : 
P = (PD. ,PO.,,D,) 
PD, = (DC.,,V.,,D,,) 
PO, = (PF.,T,,D,,) 
一 其 中 ,D, 表示 概念 的 属性 是 否 可 描述 或 可 测量 ， 
可 作为 D;, 和 Di; 概念 的 数据 属性 PD, 结构 中 DC. = 
9p@ 轩 DC. 表示 数据 属性 PD, 所 属 的 定义 域 为 概念 集 
CSY, 表示 数据 属性 PD, 的 取 值 类 型 ,Dm 表 示 数 据 必 
性 EP, 是 否 可 描述 或 可 测量 ;概念 的 对 象 属性 PD, 结 
构 卉 PF, 表示 该 对 象 属性 P0. 所 属 的 父 属性 ,7, 表示 
齐 属 性 PO, 的 特性 ,D,。 表 示 对 象 属性 PO, 是 否 可 描 


2 ) 概念 C, 及 其 属性 已 相关 的 方法 集 : 
11 = (NE ,WHOCC ,Di 

.全 其 中 ,MP. 表示 方法 的 公式 描述 ;MOCG, 表示 方法 
涉及 的 对 象 类 型 组 合 ,包括 概念 及 其 属性 组 合 .概念 与 
概 窟 的 组 合 ;D, 表示 方法 是 否 可 描述 或 可 测量 。 

三 (3 ) 概 念 C,、 属 性 P, 及 方法 M, 之 间 的 关系 集 : 
0 R= (REFM,,PO.,,RLM,,ROCG,,D,) 

”其 中 ,RFM, 表示 语义 关联 前 者 ;PO, 表示 对 象 间 
的 语义 关系 , 即 对 象 属性 集 ;RLM, 表示 语义 关联 后 者 ; 
ROCG, 表示 语义 关联 对 象 类 别 组 合 ,包括 概念 与 概念 
旧 合 .属性 与 属性 组 合 .方法 与 方法 组 合 . 概 念 与 属性 
合 ,概念 与 方法 组 合 .属性 与 方法 组 合 ;Dx 表示 语义 
关系 是 否 可 描述 或 可 测量 。 

D, 表示 数据 属性 Dw .对 象 属性 D 方法 D, 或 
关系 D; 是 否 可 描述 或 可 测量 ,D, =0 表示 关系 不 可 描 
述 ,D, =1 表示 关系 可 描述 但 不 可 测量 ,D, = 2 表示 关 
系 可 描述 且 可 测量 。 

由 上 述 科技 文献 知识 元 本 体 结构 KEOw 可 知 , 科 
技 文献 知识 元 。 的 本 体 结构 的 组 成 元 素 可 具体 表示 为 
概念 集 C, = | C1,C;,C;,…| .属性 集 已 = | P,P,,P，， 
…| 方法 集 ,= |M,M, ,MM ，,…| 和 关系 集 R, = | RR， 
RR,,R,，,…| 。 该 科技 文献 知识 元 本 体 结构 ,可 清晰 地 描 
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述 出 科技 文献 的 知识 元 结构 和 知识 元 之 间 的 语义 关 
3.2 ”科技 文献 知识 元 本 体 模型 的 要 素 定 义 

依据 上 述 给 出 的 科技 文献 知识 元 本 体 的 形式 化 数 
学 模型 ,定义 出 科技 文献 知识 元 的 概念 集 、 属 性 集 、 方 
法 集 及 关系 集 的 具体 内 容 。 同 时 ,依据 T. R. Grubers 
的 本 体 设 计 原则 ,对 科技 文献 知识 元 本 体 模型 的 每 
个 设计 阶段 进行 规范 ,描述 了 科技 文献 中 语义 层面 的 
知识 ,保证 了 本 体 模 型 具有 明确 性 、 客 观 性 一 致 性 、 可 
拓展 性 和 最 小 本 体 承 诺 ” 。 
3.2.1 科技 文献 知识 元 本 体 的 概念 集 在 概念 集 的 
设计 阶段 ,要 保证 本 体 模 型 具有 明确 性 、 客 观 性 、 一 致 
性 和 可 拓展 性 ,明确 各 类 概念 术语 的 涵义 ,避免 二 义 
性 ,确保 概念 类 具有 语义 一 致 性 , 且 在 添加 新 概念 时 无 
需 修改 已 有 内 容 , 使 得 该 知识 元 本 体 模型 中 的 概念 集 
能 全 面 .抽象 化 地 描述 科技 文献 中 不 同 层 次 下 的 各 类 
知识 元 。 

从 科技 文献 特征 角度 ,将 一 篇 科技 文献 明确 地 划 
分 为 内 容 特 征 和 外 部 特征 两 大 概念 类 ,对 每 一 概念 类 
进行 扩展 ,获得 该 科技 文献 知识 元 本 体 的 概念 集 。 科 
技 文献 的 外 部 特征 包括 符号 标识 、 书 名 、 正 文 语种 、 作 
者 、 出 版 时 间 、 出 版 社 . 期 刊 .会 议 . 文 献 类 型 九 大 
类 ,其 中 ,科技 文献 的 类 型 又 包括 科技 图 书 、 科 技 期 
刊 专利 文献 .会 议 文献、 科技 报告 .政府 出 版 物 .学 位 
论文 .标准 文献 .产品 资料 和 其 他 文献 等 ”。 科 技 文 
献 的 内 部 特征 包括 学 科 .主题 .分 类 号 .关键 词 .创新 点 
以 及 摘要 引言、 研究 现状 、 核 心 研究 内 容 、 实 验 与 评 
价 结论 与 展望 等 功能 性 特征 。 科 技 文献 知识 元 本 体 
的 概念 及 概念 间 的 层次 结构 见 图 1。 
3.2.2 科技 文献 知识 元 本 体 的 属性 集 ”在 属性 集 的 
设计 阶段 ,保证 本 体 模型 具有 明确 性 、 客 观 性 一 致 性 
和 最 小 本 体 承 诺 ,各 类 概念 要 具有 相对 统一 、 清 晰 、 简 
洁 的 属性 集 , 使 得 该 知识 元 本 体 模型 能 统一 描述 出 各 
类 知识 元 的 内 部 结构 。 故 将 科技 文献 知识 元 本 体 中 概 
念 类 的 属性 分 为 两 大 类 , 即 数据 属性 和 对 象 属性 , 且 同 
类 属性 之 间 存 在 一 定 的 层次 关系 。 数 据 属性 描述 概念 
类 固有 特性 的 数据 特征 , 即 科技 文献 知识 元 本 体 中 概 
念 类 的 属性 集 P, 概 念 子 类 继承 其 父 类 的 数据 属性 ;对 
象 属性 指 概念 类 或 属性 之 间 的 语义 关系 ,具体 描述 科 
技 文献 知识 元 本 体 中 的 部 分 关系 集 R。 

在 科技 文献 知识 元 本 体 中 ,数据 属性 包括 内 容 特 
征 类 中 概念 的 属性 和 外 部 特征 类 中 概念 类 的 属性 。 在 
内 部 特征 类 中 ,摘要 .引言 .研究 现状 ,核心 研究 内 容 、 
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的 继承 关系 


实验 与 评价 结论 与 展望 类 均 具有 知识 标识 号 、 知 识 元 
名 称 、 知 识 导航 原文 内 容 、 文 本 长 度 、 表 示 形 式 \ 特 征 
词 . 引 文 编号 等 属性 ;在 外 部 特征 类 中 ,符号 标识 的 
属性 有 文献 编号 .专利 号 标准 号 .报告 号 , 书 名 的 属性 
包括 题名 和 篇 名 ,出 版 社 的 属性 有 出 版 社 名 称 、 出 版 社 
地 址 ,期 刊 的 属性 有 期 刊 名 称 、 卷 期 /页 .会议 的 
会 议 名 称 会 议 地址 ,正文 语种 的 属性 有 汉语 、 外 语 ， 
作者 类 的 属性 包括 编号 .地址 单位、 名字 性 别 .国籍 、 
职称 。 
在 科技 文献 知识 元 本 体 中 ,对 象 属性 包括 同位 关 
系 和 等 级 关系 两 种 ” :同位 关系 可 细 分 为 创新 关系 、 
同 义 关系 (如 阐述 关系 ) ,定位 关系 、 相 关 关系 、 顺 序 关 
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注 : 矩 形 方 框 表示 一 个 概念 ,实心 箭头 代表 概念 与 概念 之 间 的 部 分 与 整体 关系 ,空心 箭头 代表 概念 与 概念 之 间 


系 等 ,其 中 ,相关 关系 包括 交叉 关系 (如 合作 关系 ) .并 
列 关系 、 互 斥 关系 ,顺序 关系 可 细 分 为 引出 关系 、 次 序 
关系 ,演化 关系 . 列 含 关系 ,撰写 关系 等 ;等 级 关系 可 细 
分 为 部 分 与 整体 关系 、 继 承 关系 、 属 性 关系 、 实 例 关系 
等 。 科 技 文献 知识 元 本 体 中 对 象 属性 的 具体 描述 见 表 
1。 除 具有 对 称 性 的 对 象 属性 外 ,其 他 对 象 属性 都 具有 
逆 属 性 ,如 引出 关系 的 逆 属 性 为 被 引出 关系 等 ,由 于 篇 
幅 限制 ,本 文 不 再 详 述 。 

3.2.3 科技 文献 知识 元 本 体 的 方法 集 在 方法 集 的 
设计 阶段 ,要 保证 本 体 模型 的 明确 性 、 一 致 性 ,定义 的 
各 种 方法 要 有 意义 且 不 存在 矛盾 。 科 技 文 献 知识 元 本 
体 的 方法 集体 现 了 科技 文献 中 概念 、 属 性 之 间 的 函数 
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表 1 科技 文献 知识 元 本 体 的 对 象 属性 集 


ID 对 象 属性 名 父 属性 特性 Dro 属性 的 内 涵 说 明 
1 同位 关系 无 无 0 描述 同一 级 别 概念 间 的 语义 关系 
2 等 级 关系 无 无 0 描述 不 同 级 别 概念 间 的 语义 关系 
3 比 … 有 创新 同位 关系 传递 性 1 概念 B 比 概念 A 有 创新 性 
4 与 … 同 义 (如 阐述 ) 同位 关系 传递 性 1 概念 B 与 概念 A 同 义 ,如 概念 B 阐述 了 概念 A 
5 位 于 … 内 /定位 于 . 同位 关系 传递 性 1 概念 A 位 于 概念 B 的 空间 范围 内 
6 相关 同位 关系 。 ”传递 性 .对 称 性 “0 描述 具有 一 定 相关 性 的 语义 关系 
7 顺序 同位 关系 非 对 称 性 0 描述 具有 次 序 性 的 语义 关系 
8 与 … 相 交 于 (与 . .合作 ) 相关 对 称 性 概念 A 与 概念 B 具有 交叉 部 分 ,如 实体 A 与 实体 B 具有 合作 关系 
9 与 … 并 列 相关 对 称 性 1 概念 A 与 概念 B 属于 同 级 并 列 关系 
10 与 … 互 斥 相关 对 称 性 1 概念 A 与 概念 B 不 存在 交叉 关系 
11 引出 顺序 传递 性 1 概念 人 引出 了 概念 B 
12 先 于 (次 序 ) 顺序 传递 性 2 概念 A 排列 在 概念 B 之 前 
13 演化 为 顺序 传递 性 1 概念 A 可 演化 为 概念 B 
4 理 仿 顺序 传递 性 1 概念 A 蕴含 着 概念 B( 隐 性 关系 ) 
2; 撰写 了 顺序 非 对 称 性 1 概念 A 撰写 了 概念 B 
所 构成 了 等 级 关系 传递 性 1 概念 A 构成 了 概念 B( 显 性 关系 ) (部 分 与 整体 关系 ) 
< 继承 于 等 级 关系 传递 性 1 概念 A 继承 于 父 概念 B 
已 : 属于 等 级 关系 传递 性 1 属性 A 属于 概念 
OO, 是 … 的 实例 等 级 关系 传递 性 实例 A 是 概念 B 的 实例 


:对 象 A 位 于 对 象 属性 之 前 ,对 象 B 位 于 对 象 属性 之 后 
开 。 由 于 题名 和 摘要 信息 更 能 代表 文本 的 主题 信 


se ,以 此 构建 科技 文献 句子 级 创新 点 的 识别 方法 ， 


可 组 象 描述 理论 或 方法 创新 点 的 识别 过 程 ;依据 科技 
文献 技术 创新 点 较 多 出 现在 核心 研究 内 容 意 节 的 规 
>< 表 2 科技 文献 知识 元 本 体 的 方法 集 


律 ,定义 了 技术 创新 点 的 识别 方法 ;借鉴 已 有 的 学 术 文 
献 文体 特征 研究 ” ,简化 了 文本 长 度 的 计算 方法 , 具 
体内 容 如 表 2 所 示 : 


法 名 方法 描述 对 象 类 型 


Dy 方法 说 明 


_ 理 伦 创 新 点 (题名 .特征 词 A 主题 词 A 目 的 概述 . 特征 词 。 C,P 
_ 的 识别 法 AL. 特征 词 ) 夫 @ 一 L s 理论 创新 点 
复活 创新 点 (题名. 特征 词 A 主题 词 人 方法 概述 . 特征 
的 识别 法 AL. 特征 词 ) 关 一 Le 方法 创新 点 
技术 创新 点 〈S. 特征 词 人 研究 技术 . 特征 词 ) 关 A(S. 特 ” C,P 
的 识别 法 征 词 关 已 有 技术 成 果 . 特征 词 ) 一 Se 技术 创 
新 点 
文本 长 度 计 (S. 原文 内 容 关 中) A(S. 表示 形式 = 文字 )-、 P,P 
算法 (S. 文 本 长 度 =Length( 原 文 内 容 ) ) 


司 CC,P 


所 


注 :C 代表 科技 文献 知识 元 本 体 概 念 类 ,P 代表 概念 类 的 属性 ;知识 元 S 属于 摘要 ,引言 研究 现状 、 核 心 研究 内 容 、 实 验 与 评价 结论 与 展 


1 ” 若 某 知识 元 L 的 特征 词 与 该 科技 文献 题名 的 特征 词 .主题 词 结论 概述 

中 的 特征 词 均 存在 相同 /相似 词 时 , 则 该 知识 元 工 就 是 理论 创新 点 

1 ， 若 某 知识 元 工 的 特征 词 与 该 科技 文献 题名 的 特征 词 .主题 词 方法 概述 
中 的 特征 词 均 存在 相同 /相似 词 时 , 则 该 知识 元 工 就 是 方法 创新 点 

1 ， 若 存 在 某 知识 元 S 的 特征 词 与 该 科技 文献 中 研究 技术 特征 词 相同 , 且 久 
识 元 S 的 特征 词 与 已 有 技术 成 果 的 特征 词 不 相同 , 则 该 知识 元 5S 属于 技 
术 创 新 点 

2 某 知识 元 S 的 原文 内 容 非 空 且 表示 形式 为 文字 , 则 字符 长 度 值 即 为 其 
文本 长 度 


望 六 大 类 相关 的 概念 子 类 中 某 一 类 的 实例 ,知识 元 工 属于 引言 /研究 现状 /核心 研究 内 容 /实验 与 评价 /结论 与 展望 五 大 类 相关 的 概念 子 类 中 某 


一 类 的 实例 
3.2.4 科技 文献 知识 元 本 体 的 关系 集 ”在 关系 集 的 
设计 阶段 ,要 保证 本 体 模型 具有 明确 性 一致 性 、 最 小 
本 体 承 诺 , 尽 量 避 免 对 同一 事物 做 出 大 量 的 推断 ,满足 
科技 文献 领域 知识 共享 与 交流 的 需求 即 可 。 该 模型 通 
过 分 析 科 技 文献 中 的 科研 思路 ,定义 科技 文献 知识 元 
本 体 中 概念 、 属 性 及 方法 之 间 的 语义 关系 ,具体 内 容 见 


表 3。 其 中 ,概念 间 的 继承 关系 、 部 分 与 整体 关系 见 
1 。 

对 科技 文献 概念 进行 扩展 分 层 , 限 定 概 念 的 属性 
特征 ,描述 概念 及 属性 之 间 的 方法 集 ,表示 出 概念 、 属 
性 及 方法 之 间 的 语义 关系 ,最 终 构建 出 一 个 科技 文献 
知识 元 本 体 模型 。 
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表 3 科技 文献 知识 元 本 体 的 关系 集 


ID 对 象 关系 对 象 对 象 类 别 DR 

1 形式 特征 相 斥 于 内 容 特 征 CC 1 

2 已 有 技术 成 果 相 斥 于 已 有 方法 成 果 C,C 1 

3 已 有 方法 成 果 相 斥 于 已 有 理论 成 果 c,c 1 

4 作者 撰写 书 名 EC 1 

5 作者 与 .合作 作者 GC 1 

6 理论 创新 点 比 … 有 创新 已 有 理论 成 果 CC 1 

7 方法 创新 点 比 … 有 创新 已 有 方法 成 果 CC 1 

8 技术 创新 点 比 … 有 创新 已 有 技术 成 果 c,c 1 

9 引言 引出 研究 现状 C,C 1 

10 研究 现状 引出 研究 内 容 C,C 二 

11 研究 内 容 引出 实验 与 评价 oe 1 

12 实验 与 评价 引出 结论 与 展望 C,C 

13 概念 定义 引出 研究 背景 C,C 1 

14 研究 背景 引出 关键 问题 GE 1 

15 关键 问题 引出 研究 目的 CC 1 

5 16 研究 目的 引出 人 研究 思路 C,C 1 
CN_r 已 有 研究 成 果 引出 现存 问题 c,c 1 
[ew 18 已 有 理论 成 果 与 … 并 列 已 有 方法 成 果 CG 1 
<T 1 已 有 方法 成 果 与 … 并 列 已 有 技术 成 果 CC 1 
己 20 研究 理论 先 于 研究 假设 CC 2 
-21 实验 数据 先 于 实验 工具 C,C 2 
0 2 实验 工具 先 于 数据 处 理 与 分 析 C,C 2 
OO 2 数据 处 理 与 分 析 先 于 实验 结果 CC 2 
GD 24 评价 指标 先 于 评价 方法 EC 2 
GN 25 评价 方法 先 于 评价 结果 C,C a 
~ 26 已 有 方法 成 果 演化 为 研究 方法 c,c 1 
2 已 有 理论 成 果 演化 为 研究 理论 a 1 
> 28 已 有 技术 成 果 演化 为 研究 技术 c,C 1 
>< 29 书 名 蕴含 主题 C,C 
[a 30 分 类 号 蕴含 主题 CC 1 
Sal 分 类 号 蕴含 学 科 Cc 1 
we 32 文献 题目 蕴含 主题 P,C 1 
,3 概念 类 . 特征 词 蕴含 主题 P,C 1 
O 〇 ,» 概念 类 . 引文 编号 位 于 … 内 文献 编号 P,C 2 
35 汉语 与 … 相 斥 外 语 P,P 1 

36 文本 长 度 计算 法 引出 文本 长 度 M,P 2 

37 理论 创新 点 识别 法 引出 理论 创新 点 M,C 1 

38 方法 创新 点 识别 法 引出 方法 创新 点 M,C 1 

39 技术 创新 点 识别 法 引出 技术 创新 点 M,C 1 

40 理论 创新 点 识别 法 与 … 并 列 方法 创新 点 识别 法 M,M 1 


注 :C 代表 科技 文献 知识 元 本 体 概念 类 ,P 代表 概念 类 的 属性 ,M 代表 概念 类 相关 的 方法 


4 ”示例 及 讨论 


4.1 示例 

实验 将 以 一 篇 科技 文献 为 例 ,基于 科技 文献 知识 
元 本 体 模型 ,对 该 科技 文献 中 的 知识 元 进行 表示 与 描 
述 ,用 于 说 明 上 述 知识 表示 模型 的 合理 性 。 采 用 
protégé 4.3.0 版 本 的 本 体 开发 工具 构建 知识 元 本 体 模 
型 ,通过 protégé 自 带 的 HermiT 推理 机 实现 了 对 该 本 
体 连 续 性 和 一 致 性 的 检测 ,表明 该 模型 具有 人 逻辑 推理 


100 


的 能 力 。 由 于 protégé 4.3.0 版 本 的 推理 结果 未 能 正确 
地 显示 出 本 体 模型 中 概念 类 的 中 文 标签 , 故 本 实验 将 
运用 英文 标签 呈现 该 本 体 模型 的 表示 及 推理 的 全 过 
程 。 

4.1.1 科技 文献 知识 元 本 体 模 型 的 构建 ”由 于 
CNKI ,万 方 等 学 术 期 刊 数据 库 已 采用 科技 文献 知识 元 
本 体 模 型 的 外 部 特征 对 文献 进行 分 类 , 故 本 实验 主要 
构建 科技 文献 知识 元 本 体 模型 的 内 容 特 征 单元 ,呈现 
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科技 文献 的 内 容 结构 。 科 技 文献 知识 元 本 体 模型 的 部 
分 内 容 如 图 2 所 示 : 


目 Resear' bi 
Researchpurpose 
Keywords 
"SRelatedStatus 
"SResearchContent 

@ Subject 


Reasoner active — [¥Y| Show Inferences 


2 科技 文献 知识 元 本 体 模 型 (部 分 ) 


4CRP 科技 文献 知识 元 本 体 模型 的 表示 及 推理 从 
万 邓 数 据 库 中 ,选择 近 两 年 (2016 - 2017 年 ) 在 国内 情 
报 革 核心 期 刊 (情报 学 报 》 中 被 引 次 数 最 高 且 与 本 广 
括 芭 最 相关 的 文献 作为 示例 文献 , 即 由 黄 永 、 陆 伟 及 程 
齐 勘 撰写 的 题名 为 《学 术 文本 的 结构 功能 识别 一 基 
中 。 该 文献 的 写作 结构 


,完整 地 描述 出 引言 类 中 5 个 概念 子 类 的 实例 知 
庙 58, 具 有 很 好 的 代表 性 。 
ss 由 科技 文献 知识 元 本 体 的 层次 结构 可 知 , 引言 
(J 蕊 oduction ) 知识 元 可 细 分 为 概念 定义 .研究 背景 . 关 
键 问题 等 知识 元 。 在 引言 部 分 ,一 般 先 对 某 领 域 中 主 
要 网 概念 进行 描述 ,再 深入 到 该 主题 领域 的 研究 背景 ， 
剂 大 出 目前 仍 存在 的 或 待 解决 的 关键 问题 ,形成 一 条 
“概念 定义 (ConceptDefinition ) 一 研究 背景 ( Research- 
Background ) 一 关键 问题 (ResearchProblem ) ”知识 链 。 
若 从 某 篇 科技 文献 的 引言 中 找 出 概念 定义 的 知识 元 
10 .关键 问题 的 知识 元 12、 及 男 一 个 知识 元 11 , 而 该 知 
识 元 11 在 语义 上 是 由 知识 元 10 引出 的 ,进而 引出 知 
识 元 12 , 则 需 判 断 从 引言 中 找 出 的 知识 元 11 是否 属于 
人 研究 背景 。 将 这 样 的 逻辑 思路 输入 protégé 本 体 编 辑 
器 中 ,运行 HermiT 推理 机 可 得 ,知识 元 11 属于 引言 中 
的 研究 背景 知识 元 。 该 结果 在 Description 11 的 Type 
类 中 的 虚线 框 内 , 即 表 明 上 述 逻 辑 关系 得 到 了 验证 , 详 
细 的 推理 结果 见 图 3。 
另外 ,在 对 科技 文献 知识 元 本 体 模型 的 方法 集 进行 
演绎 时 ,科技 文献 中 理论 创新 点 的 识别 方法 为 : 待 判定 
知识 元 的 特征 词 与 题名 (Title) .主题 词 (Theme) 、 及 摘要 
中 目的 概述 (PurposeOverview ) 的 特征 词 均 有 交集 , 则 该 
知识 点 是 理论 创新 点 (TheoryInnovation ) 。 从 核心 研究 


< untitled-ontology-27 (http://www.semanticweb.org/lenovo/ontol... 一 号 区 到 
Reasoner Tools Refactor Window Help 
[ 
SS 
DL Query | OntoGraf | SpARQL Query | Ontology Differences | 
| Classes | Object Properties | 


eclicit 12 
加 continue 12 
misSameLevelOf 12 


Us OriginalCont 
Theme (1) ent“ 在 之 前 
GTI 01 


虽 
的 研究 中 ， 笔 


者 基于 章节 标 
题 识别 章节 结 
构 功 能 ， 将 基 
于 章节 标题 的 
车 构 功 能 识别 二 
问题 转化 为 序 
列 标 注 问 题 ， 
MM on (1) 并 在 人 工 标 注 


v st 的 数据 集 上 取 
: da (1) 得 了 较 高 的 准 


图 3 ”科技 文献 知识 元 本 体 模型 的 表示 及 推理 


内 容 中 找到 某 一 理论 知识 点 (KnowledgePoint01) ,依据 
上 述 判 定 规则 ,分 别 创 建 题名 、 主 题词 .目的 概述 的 实 
例 01。 由 于 待 判定 的 知识 点 实例 的 特征 词 含 有 题名 
实例 01( Tite01) \ 主 题词 实例 (Theme01) 和 目的 概述 
实例 (PurposeOverview01) 中 的 同一 特征 词 ,验证 出 该 
知识 点 是 文献 的 理论 创新 点 。 具 体 的 操作 痕迹 见 
3。 
4.2 分 析 与 讨论 

笔者 通过 分 析 科 技 文献 的 文本 结构 ,在 知识 元 本 
体 理论 的 基础 上 ,构建 一 个 科技 文献 知识 元 本 体 模型 
用 于 表示 科技 文献 中 知识 元 的 结构 和 知识 元 之 间 的 语 
义 关系 。 该 知识 元 本 体 模型 在 内 容 呈 现 、 构 建 方法 、 应 
场景 等 方面 均 呈 现 较 好 的 效果 ,具体 包括 以 下 几 点 : 

(1) 呈 现 清晰 的 知识 组 织 体系 。 笔 者 构建 的 科技 

文献 知识 元 本 体 模 型 具备 横向 和 纵向 双重 组 织 结构 : 
QD 在 该 模型 的 横向 结构 中 ,从 科技 文献 的 外 部 特征 和 
内 容 特 征 着 手 , 逐 层 深 入 科技 文献 的 章节 、 段 落 中 , 搜 
寻 科 技 文献 中 的 功能 性 知识 点 ,最 终 呈 现 出 科技 文献 
内 不 同 层次 的 知识 结构 ;@) 在 该 模型 的 纵向 结构 中 ,从 
科研 习惯 的 角度 ,首先 关注 科技 文献 显而易见 的 外 部 
特征 ,对 科技 文献 的 作者 文献 类 型 .出 版 社 .出 版 时 间 
等 作 初 步 得 选 ,再 深入 科技 文献 内 容 中 ,阅读 摘要 、 引 
言 等 章节 ,快速 了 解 该 文献 的 大 致 内 容 , 如 果 发 现 有 用 
户 关 注 的 相关 主题 知识 ,再 继续 深入 挖掘 该 章节 中 用 
户 所 需 的 精准 知识 元 。 故 该 本 体 模 型 能 清晰 地 呈现 科 
技 文献 领域 中 的 文本 结构 及 知识 脉络 。 

(2) 更 为 精准 、 高 效 的 模型 构建 法 。 该 知识 元 本 
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体 模型 的 构建 法 融合 了 本 体 构建 法 和 知识 元 构建 法 的 
双重 优势 :CD 在 本 体 构 建 方法 的 指引 下 ,构建 出 的 本 体 
概念 框架 能 抽象 化 描述 科技 文献 中 通用 的 文本 结构 ， 
据 此 可 将 篇 章 级 的 科技 文献 分 割 为 句子 级 的 细 粒 度 知 
识 和 点 。 另 外 ,依据 所 构建 的 本 体 模型 中 的 知识 链 网 络 ， 
不 仅 能 精准 定位 并 表示 科技 文献 中 丰富 的 知识 点 ,而 
且 能 有 效 地 推动 科技 文献 内 知识 的 推理 及 发 现 。 书 融 
入 知识 元 的 na 元 组 构建 法 的 思想 ,对 科技 文献 中 知识 
元 所 属 概念 类 的 属性 特征 进行 规范 ,采用 相对 统一 的 
属性 集 ,简洁 、 高 效 地 表示 出 科技 文献 中 摘要 、 引 言 .人 研 
究 现 状 等 知识 元 以 及 研究 背景 .研究 问题 .研究 方法 等 
更 细 粒 度 知 识 元 的 内 部 结构 ,有 利于 学 术 论 文 ,期刊 论 
文学 位 论文 .专利 等 各 类 文献 资料 中 知识 的 表示 、 存 


识 组 织 和 知识 标 引 场 景 中 ,辅助 不 同 
的 用 户 学 习 不 同 领域 的 科研 知识 :D 在 知识 表示 
的 到 用 场景 中 ,可 依据 该 本 体 模型 ,对 某 领域 科技 文献 
中 的 重要 知识 点 进行 描述 和 标注 ,便于 用 户 快速 了 解 
本 横 域 科技 文献 的 知识 结构 ,辅助 具有 其 他 学 科 背景 
的 央 户 快速 学 习 本 领域 的 专业 知识 ;@ 在 知识 组 织 的 
所 肚 场 景 中 ,对 于 还 未 形成 规范 的 科研 及 写作 思路 的 
学 术 研 究 者 ,可 依据 该 模型 中 呈现 的 科技 文献 文本 结 
构 节 解 本 领域 科技 文献 的 科研 思路 及 写作 模式 ,缩短 
部 省 平 科研 成 果 的 产 出 周期 ,促进 多 领域 学 科 的 快 束 
发 展 ;@ 在 知识 标 引 的 应 用 场景 中 ,该 本 体 模型 可 被 应 
用 是 在 线 投稿 系统 。 在 论文 投稿 时 ,编辑 部 将 依照 该 
本 体 模 型 , 设 定投 稿 论 文 应 具备 的 主要 知识 模块 ,规范 
投稿 论文 的 内 容 及 格式 ; 当 该 论文 已 被 录用 后 ,编辑 前 
应 鼓励 并 引导 该 论文 作者 以 该 本 体 模型 的 知识 结构 为 
标准 ,对 论文 内 容 进行 精准 分 解 及 标注 ,促进 科技 文献 
领域 知识 的 协同 标 引 。 

综 上 所 述 ,该 本 体 模型 能 较 好 地 表示 和 描述 科技 
文献 的 文本 结构 及 知识 元 的 内 部 结构 关联 ,拥有 广泛 
的 应 用 前 景 , 且 能 为 广大 用 户 提供 更 加 高 效 的 文献 知 
识 服务 。 


5 结论 与 展望 


为 了 提供 细 粒 度 的 精准 知识 点 服务 ,笔者 在 分 析 
科技 文献 内 容 的 层次 性 功能 结构 的 基础 上 ,提出 一 种 
面向 科技 文献 的 知识 表示 模型 ,并 以 一 篇 科技 文献 为 
例 ,统一 表示 科技 文献 中 细 粒 度 知 识 元 的 内 外 部 特征 
及 知识 元 之 间 的 逻辑 关系 ,为 多 角度 精准、 快速 的 知 
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识 点 检索 奠定 坚实 的 理论 基础 。 该 本 体 模 型 可 作为 科 
技 文献 内 知识 资源 的 表示 及 存储 模式 标准 ,用 于 改善 
现 有 粗 粒 度 的 文献 知识 服务 模式 ,获取 粒度 更 小 .层次 
更 深 的 科技 资源 。 将 该 本 体 模 型 应 用 于 科技 文献 知识 
资源 的 组 织 与 协同 标 引 场景 中 ,将 会 改变 论文 出 版 商 
和 科研 工作 者 的 知识 发 布 使 用 传播 .获取 方式 ,促进 
细 粒 度 知 识 资 源 的 共享 及 创新 知识 点 的 发 现 。 
笔者 仅 运 用 一 个 示例 还 不 足以 验证 该 模型 的 有 效 
性 ,该 模型 仍 存在 以 下 几 点 不 足 :WD 科技 文献 知识 元 本 
体 模 型 仅 呈 现 了 科技 文献 领域 通用 的 文本 结构 ,而 在 
不 同学 科 .主题 等 领域 下 ,科技 文献 的 文本 结构 会 有 所 
不 同 , 仍 需要 进一步 细 化 该 模型 的 适用 领域 ,完善 该 模 
型 的 本 体 结构 ;@ 该 本 体 模型 仍 未 得 到 科学 的 评估 及 
验证 ,在 今后 的 工作 中 将 会 深入 研究 科技 文献 知识 元 
本 体 模型 的 评价 方法 。 
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Abstract: [ Purpose/significance | With the rapid growth of scientific literature resources, users are surrounded by 


the ocean of scientific literature, and the future trend of the document knowledge retrieval is to provide users with fast and 


accurate fine -grained knowledge element services. [ Method/process | Based on the analysis of the content structure of 


scientific literature, this paper went gradually and deeply into the scientific literature contents, with a view of constructing 


a knowledge element ontology model of scientific literature for the knowledge representation, to express fine -grained know|- 


edge points owning holonomic sentence meanings in the content of scientific literature as knowledge elements with a unified 


structure. [ Result/conclusion | The paper illustrates the rationality of the model of scientific literature by the means of 


displaying the content of a scientific literature, but this example only shows knowledge points in the introduction of scien- 


tific literature and the knowledge element ontology model needs to be further verified. 
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